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23545/we 

Die Erfindung betrifft ein Ubertragungssystern zur Ubertragung von 
Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden 
Dateniibertragungs-Netzes, z.B. LAN, Intranet, Internet, in welchem die Ubertragung mittels 
Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. Internet- 
Protokolls, erfolgt, und jeder Teilnehmer iiber eine eine Sende- und Empfangseinheit sowie 
eine Sprach-Datenwandlereinheit beinhaltende Sprachdatenubertragungseinheit, 
gegebenenfalls einen Analog/Digital- Wandler bzw. einen Digital/Analog- Wandler und eine 
daran angeschlossene Sprech- und Horvorrichtung mit dem Netz in Verbindung steht, wobei 
die Sprechvorrichtung bzw. der zwischengeschaltete Analog/Digital- Wandler iiber einen 
Additions-Eingang einer Echo-Unterdriickungseinheit und deren Ausgang mit der 
Sendeeinheit verbunden ist und ein Subtraktions-Eingang der Echo-Unterdriickungseinheit 
mit der Horvorrichtung bzw. dem zwischengeschalteten Digital/ Analog- Wandler verbunden 
ist. 

In Netzwerken, wie z.B. LAN, Intranet, Internet o.a., die auf einem 
standardisierten Protokoll, z.B. dem Internet-Protokoll basieren, ist jedem Netzteilnehmer 
eine Adresse zugeordnet, von der Daten an andere Teilnehmer gesendet bzw. an der von 
anderen Teilnehmern abgeschickte Daten empfangen werden konnen. Da auch Sprache in 
Form von digitalen Daten iibertragbar ist, konnen solche Datemibertragungs-Netze auch zur 
Sprachiibertragung herangezogen werden. Die Art des Netzwerks und des 
Ubertragungsprotokolls ist im Rahmen der Erfindung nicht auf die vorstehend genannten 
bekannten Bezeichnungen eingeschrankt, die Erfindung laBt sich auch auf alle moglichen 
miteinander vernetzten Netzwerke anwenden, die an bestimmten Punkten iiber 
Transformationseinheiten (Gateways) miteinander verkniipft sein konnen. 

Bei bisher bekannten Sprachiibertragungssystemen der eingangs genannten Art 
erfolgt die Sprachiibertragung in definierten Paketen, die von der Sendestelle an einen 
empfangenden Teilnehmer ausgesendet und von diesem in Empfang genommen werden. Die 
Pakete werden zu diesem Zweck in nacheinanderfolgender Reihenfolge aus den digitalisierten 
Abtastwerten des zu sendenden Sprachsignals zusammengesetzt und konnen fur die 
Ubertragung auf der Sendeseite entsprechend kodiert und nach ihrem Empfang auf der 
Empfangerseite dekodiert werden. Die empfangenen Abtastwerte werden wieder zu einem 
Sprachsignal zusammengesetzt, wobei unter Sprachsignal alle im horbaren Bereich 
gelegenen, akustischen Schwingungen verstanden wird. Im Unterschied zur Ubertragung iiber 
Telephonleitungen besteht die Besonderheit der Sprachiibertragung in 
Dateniibertragungsnetzen darin, daB die Ubertragungsbandbreite vom Netzanbieter nicht 
immer garantiert wird. Ebenso erfolgen an verschiedenen Knoten je nach Vorliegen von 
freien Leitungen standige Anderungen des vermittelten Pfades, iiber den die Ubertragung der 
Datenpakete vorgenommen wird. Aufgrund der unterschiedlichen Laufzeiten oder 
unterschiedlichen Datenwege konnen spater ausgesendete Datenpakete beim Empfanger 
fhiher ankommen als vor diesen ausgesendete Datenpakete. Durch derartige 
Verzogerungseffekte kann es geschehen, daB einzelne Datenpakete nicht zum richtigen 




Zeitpunkt beim Empfanger eintreffen und daher nicht rechtzeitig verfugbar sind. Weiters 
konnen die Datenpakete durch Ubertragungsfehler verloren gehen. 

Bei grofieren Netzen, wie zum Beispiel im Internet, sind die Schwankungen 
der Ubertragungsverzogerungen deutlich merkbar und hangen von der jeweiligen gerade 
vorhandenen Belastung durch die verschiedenen Teilnehmer ab. Neben tageszeitenbedingten 
Anderungen konnen durch bestimmte Ereignisse hervorgerufene Verlangsamungen auftreten, 
die in keiner Weise vorhersehbar sind. 

Ein System zur Vermittlung und Ubertragung von Sprachsignalen uber ein 
paketvermittelndes Netzwerk, insbesondere iiber das Internet, und ein herkommliches 
Telephon-Netzwerk ist z.B. in der WO-A-97/14238 beschrieben. Mit diesem ist eine 
Telephonverbindung von einem Telephon-Endgerat zu einem mit dem Internet verbundenen 
Rechner moglich. 

Zusatzlich zu der im Ubertragungsnetz auflretenden Verzogerung storen auch 
Echosignale die Sprachubertragung. Die akustische Kopplung zwischen einer 
Sprechvorrichtung, z.B. einem Mikrophon, und einer Horvorrichtung, z.B. einem 
Lautsprecher, einer Horkapsel o.a., in einer Freisprecheinrichtung, in einem Telephonhorer 
o.a. oder die elektrische Kopplung, die durch eine Gabelschaltung einer analogen Zweidraht- 
Telephonleitung entsteht, kann die Ausbildung solcher Echosignale hervorrufen. 

Echosignale entstehen insbesondere dann, wenn die von einem Sprecher 
erzeugten akustischen Signale mehr oder weniger verzogert an dessen Ohr zuriickkommen. 
Bei relativ kurzen Laufzeiten des Schalls, z.B. unter 1 ms, ruft das auftretende Echo keine 
Storungen hervor, da die nattirliche akustische Kopplung zwischen Mund und Ohren oder 
Schallreflexionen im umgebenden Raum iiber Mund-Wand-Ohren ebenfalls Verzogerungen 
in derselben Groflenordnung hervorrufen, denen das menschliche Gehor standig ausgesetzt ist 
und daher vom Menschen nicht mehr bewuBt wahrgenommen werden. 

Bei langeren Echolaufzeiten, die durch Verzogerungen im Ubertragungsweg 
entstehen, wie diese bei der Sprachubertragung in paketorientierten Datennetzwerken 
auftreten und die bis zu einigen 100 ms betragen konnen, ist das Echo je nach Lautstarke 
storend bzw. wird eine Kommunikation durch dieses fast unmoglich gemacht. 

Durch geeignete Subtraktion des verzogerten Empfangssignals vom zu 
sendenden Signal konnen Echos unterdriickt werden. Dies kann sowohl in analoger Form 
mittels Summierschaltungen oder in digitaler Form vorzugsweise unter Verwendung eines 
Digitalen Signalprozessors (DSP) geschehen. Die Erfindung ist sowohl fur die analoge als 
auch die digitale Form der Echounterdriickung geeignet. 

Da Aufwand und Komplexitat einer Echo-Unterdriickimgseinheit proportional 
zur maximalen Echoverzogerungszeit sind, wird versucht, bei der Sprachubertragung uber 
Datennetzwerke die Echos auf beiden Seiten des Netzwerkes, also sowohl beim Empfanger 
als auch beim Sender, lokal zu unterdrucken und damit zu verhindern, daB iiber das 
Datennetzwerk Echos iibertragen werden. 

Sollte jedoch auf der Seite eines Teilnehmers das Echo-Unterdriickungssystem 
versagen oder aus Kostengriinden nicht implementiert sein, wird das dort entstehende Echo 



sich ungehindert zu dem mit diesem verbundenen Teilnehmer iibertragen und stort dort den 
Gesprachsverlauf. 

Die herkommlichen Echo-Unterdriickungseinheiten, die solche Echos 
bewaltigen konnen, sind hauptsachlich fur Festnetztelephonie-Ubertragungen und daher fur 
feste, relativ kurze Verzogerungszeiten ausgelegt. Fur Sprachubertragung uber ein 
paketorientiertes Datennetzwerk mit Verzogerungszeiten im Bereich von 500 ms bis 1500 ms 
sind diese bekannten Einheiten jedoch nur begrenzt wirksam. 

Durch die besonderen Eigenschaften einer paketorientierten 
Sprachubertragung kann eine herkommliche Echo-Unterdriickungseinheit sogar eine 
Verschlechterung des Echoverhaltens bewirken. Wird etwa aufgrund der sich standig 
andernden Netzwerkseigenschaften das Echosignal gegeniiber seiner urspriinglichen Zeitlage 
verschoben, liegen plotzlich im Empfangskanal sowohl das Echo als auch das zur 
Echounterdriickung erzeugte, verzogerte und invertierte Signal vor, die einander nicht mehr 
aufheben. Dieser Zustand bleibt solange erhalten, bis sich die Echo-Unterdriickungseinheit 
wieder neu eingestellt hat. 

Gehen hingegen wahrend der Ubertragung einzelne Datenpakete verloren, wird 
das inverse Signal plotzlich horbar, da es nicht auf das verlorengegangene, auszuloschende 
Signal trifft. 

Aufgabe der Erfindung ist es daher, ein Ubertragungssystem der eingangs 
genannten Art anzugeben, mit dem eine Echoausloschung fur hohe Verzogerungszeiten, 
insbesondere bei paketorientierten Datenubertragungen, auf technisch einfache und 
zuverlassige Weise ermoglicht wird. 

ErfindungsgemaB wird dies dadurch erreicht, daB eine weitere Echo- 
Unterdriickungseinheit mit einem Additions- und einem Subtraktions-Eingang vorgesehen ist, 
deren Ausgang mit der Horvorrichtung bzw. mit dem zwischengeschalteten Digital/ Analog- 
Wandler verbunden ist, und daB der Subtraktions-Eingang mit der Sendeeinheit der 
Sprachdatenubertragungseinheit und der Additions-Eingang mit der Empfangseinheit der 
Sprachdatenubertragungseinheit verbunden ist. 

Dadurch wird das durch den auf der jeweils anderen Seite des 
Dateniibertragungsnetzes befindlichen Teilnehmer entstehende Echo beseitigt, indem von 
dem ruckubertragenen Echosignal das bzw. die mindestens urn die Netzverzogerungszeit 
verzogerte, in der Sprechvorrichtung ursprunglich erzeugte Sprachsignal bzw. urspriinglich 
erzeugte Sprachinformation subtrahiert wird. Die Subtraktion kann dabei wie vorstehend 
beschrieben in analoger oder in digitaler Form vorgenommen werden. 

In weiterer Ausbildung der Erfindung kann vorgesehen sein, daB die weitere 
Echo-Unterdriickungseinheit einen Steuereingang zur Steuerung einer der 
Mindestverzogerungszeit des Netzwerks entsprechenden Speicher-Verzogerungszeit des 
Sprachsignals bzw. der Sprachinformation aufweist, wobei der Steuereingang mit dem 
Ausgang einer mit der Sprachdatenubertragungseinheit verbundenen Steuereinheit verbunden 
ist. 

Uber die Steuereinheit kann die jeweils aktuelle Netzverzogerungszeit 
festgestellt werden bzw. konnen verlorengegangene Datenpakete detektiert und die 



Ausbildung eines entsprechend verzogerten und invertierten Sendesignals unterdriickt 
werden, urn zu verhindern, daB das fur das fehlende Datenpaket gebildete, invertierte Signal 
an die Horvorrichtung gelangt. 

Gemafi einer weiteren Ausfuhrungsform der Erfindung kann bei einem 
Ubertragungssystem mit einer Echo-Unterdruckungseinheit, welche eine aus mehreren 
Verzogerungsgliedern gebildete Verzogerungskette umfaBt, vorgesehen sein, daB das erste 
Verzogerungsglied der Verzogerungskette eine relativ hohe Speicher-Verzogerungszeit 
aufweist, die im wesentlichen der minimalen Gesamtlaufzeit der Sprachdatensignale in 
beiden Richtungen des Datennetzwerkes entspricht. 

Obgleich Echosignale selbst in einem Verzogerungsrahmen von max. 64 ms 
entstehen konnen, betragt die Gesamtverzogerungszeit fur das Datennetzwerk das 10- bis 20- 
fache. Der Aufwand fur die Verzogerungsglieder und die damit verbundene 
Koeffizientenberechnung wachst proportional zur maximalen Echolaufzeit. Statt eine 
herkommliche Verzogerungskette mit einer gleichmaflig verteilten Anzahl an 
Verzogerungsgliedern und dazwischen angeordneten Anzapfungen ftir die Gewichtung des 
verzogerten Signals mit Koeffizienten k vorzusehen, ermoglicht das mit einer relativ hohen 
Speicher-Verzogerungszeit ausgestattete, erste Verzogerungsglied eine Verzogerungszeit, die 
der minimalen Gesamtlaufzeit der Sprachsignale in beiden Richtungen entspricht. Unterhalb 
dieser Verzogerungszeit ist eine Ubertragung nicht durchftihrbar, sodaB die dieser 
entsprechende Anzahl an Verzogerungsgliedern mit Anzapfungen zu diesem ersten 
Verzogerungsglied zusammengefaBt werden konnen. Die Echo-Unterdriickungseinheit 
arbeitet dann mit einer Grundverzogerung von z.B. 600ms und einem variablen 
Verzogerungsbereich von z.B. 600 ms bis 800 ms. Aufgrund der Gesamtlaufzeit innerhalb 
des Dateniibertragungsnetzes konnen sich innerhalb des Grundverzogerungsbereichs keine 
Echos ausbilden, sodaB die entsprechenden Anzapfungen und Koeffizienten k eingespart 
werden konnen. Der Vorteil besteht nun darin, daB die Echo-Unterdruckungseinheit dadurch 
viel weniger Rechenleistimg und Speicher verbraucht, da sowohl weniger Koeffizienten k 
berechnet werden mtissen als auch weniger Multiplikationen flir die Berechnung des inversen 
verzogerten Signals durchgefuhrt werden mtissen. 

GemaB einer weiteren Ausfuhmngsform der Erfindung kann die Speicher- 
Verzogerungszeit des ersten Verzogerungsgliedes der Verzogerungskette, vorzugsweise 
durch Auswertung der Zeitinformation des Echtzeit-Protokolls, uber die 
Sprachdateniibertragungseinheit steuerbar sein. Damit kann eine standige Anpassung der 
Grundverzogerungszeit des Ubertragungsnetzes vorgenommen werden, sodaB sich die Anzahl 
der benotigten Verzogerungsglieder entsprechend gering halten laBt. 

Weiters betrifft die Erfindung ein Verfahren zur Ubertragung von 
Sprachinformation innerhalb zumindest eines mehrere Teilnehmer verbindenden 
Dateniibertragungs-Netzwerkes, z.B. LAN, Intranet, Internet, in welchem die Ubertragung 
mittels Datenpaketen auf der Grundlage zumindest eines gemeinsamen Protokolls, z.B. 
Internet-Protokolls, erfolgt, wobei die von jedem Teilnehmer uber eine Empfangseinheit 
empfangene Sprachinformation in ein Sprachsignal gewandelt imd uber eine Horvorrichtung 
wiedergegeben und das von jedem Teilnehmer iiber eine Sprechvorrichtung erzeugte 



Sprachsignal in Sprachinformation gewandelt und in einer Sendeeinheit gesendet wird, und 
wobei zur Echoausloschung die uber die Empfangseinheit empfangene Sprachinformation 
oder die in ein Sprachsignal gewandelte Sprachinformation verzogert und mit Koeffizienten 
gewichtet und von dem in der Sprechvorrichtung erzeugten Sprachsignal bzw. dem in eine 
entsprechende Sprachinformation gewandelten Sprachsignal subtrahiert wird. 

Aufgabe der Erfindung ist es, ein derartiges Verfahren anzugeben, mit dem 
eine Echounterdruckung auch bei langen und sich andernden Verzogerungszeiten innerhalb 
des Datemibertragungsnetzes realisierbar ist. 

Erfindungsgemafi wird dies dadurch erreicht, daB von dem beim jeweils 
anderen Teilnehmer entstehenden und iiber das Datentibertragungsnetz ubertragenen 
Echosignal auf der Seite des mit diesem verbundenen Teilnehmers das mittels einer 
Verzogerungskette mindestens urn die Netzverzogerungszeit verzogerte, das bzw. die Echo 
verursachende und mit Koeffizienten gewichtete Sprachsignal bzw. Sprachinformation 
subtrahiert wird. 

Dadurch kann auch die Ausloschung von Echos vorgenommen werden, die 
durch Ubertragung in paketorientierten Netzwerken an den verursachenden Teilnehmer 
zuriickkommen. Die Berttcksichtigung der Netzverzogerungszeit bei der Verzogerung des 
bzw. der urspriinglich erzeugten Sprachsignals bzw. Sprachinformation ermoglicht eine 
wesentliche Reduktion des dazu erforderlichen Aufwands. Die Subtraktion kann digital oder 
analog vorgenommen werden. 

In weiterer Ausbildung der Erfindung kann vorgesehen sein, daB der bei der 
Ubertragung entstehende Verlust an Datenpaketen detektiert wird und in Abhangigkeit davon 
die Subtraktion des entsprechenden, verzogerten Sprachsignals bzw. der entsprechenden, 
verzdgerten Sprachinformation unterdruckt wird. 

Auf diese Weise wird die Ausbildung eines inversen Signals zur 
Echounterdruckung verhindert, das bei Ausbleiben des verlorengegangenen Datenpakets 
keine Ausloschung eines Echos bewirken sondern selbst ein Echosignal hervorrufen wurde. 

Weiters kann vorgesehen sein, daB bei Verlust eines oder mehrerer 
Datenpakete das jeweils vorangegangene Sprachdatenpaket wiederholt wird. 

Die Empfangseinheit wiederholt das letzte Datenpaket, urn die Pause zu 
iiberbriicken, die entsteht, wenn ein Datenpaket verlorengeht. Die Echo- 
Unterdriickungseinheit wiirde hier ein falsches Signal generieren, da sie ihrerseits mit den 
gesendeten Daten gespeist wird. Die Empfangseinheit verdoppelt dabei aber das alte 
Datenpaket, die mit den urspriinglich gesendeten Daten nicht zusammenpassen. Es wird daher 
entweder die Echo-Unterdruckung gesperrt oder es wird das letzte Datenpaket am 
Subtraktionseingang der Echo-Unterdruckungseinheit nochmals eingespeist. 

Somit kann vorgesehen sein, daB bei Wiederholung des jeweils 
vorangegangenen Sprachdatenpakets die Subtraktion eines entsprechenden Sprachsignals 
bzw. einer entsprechenden Sprachinformation auf der Seite des verbundenen Teilnehmers 
unterdruckt wird. Damit wird jegliche Echoausloschung verhindert und es kann zu keiner 
falschen Erzeugung von inversen Sprachsignalen bzw. inverser Sprachinformation innerhalb 
der Echo-Unterdruckungseinheit kommen. 



GemaB einer anderen Variante der Erfindung kann vorgesehen sein, daB bei 
Wiederholung des jeweils vorangegangenen Sprachdatenpakets das zugehorige gespeicherte 
Sprachsignal bzw. die zugehorige gespeicherte Sprachinformation des verbundenen 
Teilnehmers mit Verzogerung und Gewichtung subtrahiert wird. Dadurch kann fur die 
wiederholten Sprachdatenpakete das jeweils richtige inverse Sprachsignal bzw. die jeweils 
richtige inverse Sprachinformation subtrahiert werden. 

Weiters kann vorgesehen sein, daB bei Auftreten einer Anderung der Netz- 
Verzogerungszeit die Koeffizienten k der Verzogerungskette auf Null gesetzt werden. 

Fur den Fall, daB iiber die Hohe der Anderung keine Aussage getroffen werden 
kann, wird durch diese Maflnahme gewahrleistet, daB keine falschen Echos erzeugt und 
wiedergegeben werden. 

GemaB einer weiteren Variante der Erfindung kann vorgesehen sein, daB die 
Anderung der Netz-Verzogerungszeit gemessen wird, und daB die Werte der den 
Verzogerungsgliedern zugeordneten Koeffizienten k innerhalb der Verzogerungskette 
entsprechend dieser Anderung verschoben werden. 

Dadurch kann die Steuerbarkeit der Speicher-Verzogerungszeit auf einfache 
Weise verwirklicht werden. 

In bevorzugter Weise kann diese Verschiebung selbsttatig vorgenommen 
werden, indem in weiterer Ausbildung der Erfindung die Speicher-Verzogerungszeit des 
ersten Verzogerungsgliedes mit der relativ hohen Verzogerungszeit, vorzugsweise durch 
Auswertung der Zeitinformation des Echtzeit-Protokolls, uber die 
Sprachdateniibertragungseinheit gesteuert wird, und die Verschiebung der Koeffizienten k 
innerhalb der Verzogerungskette automatisch mit der Veranderung der Verzogerungszeit des 
ersten Verzogerungsgliedes vorgenommen wird. Durch die relativ lange Verzogerungszeit 
des ersten Verzogerungsgliedes und deren Steuerbarkeit kann die Echo-Unterdruckung 
unabhangig von der Netz-Verzogerungszeit stets mit der gleichen Rechnerleistung bewaltigt 
werden. 

Nachfolgend wird die Erfindung anhand der in den beigeschlossenen 
Zeichnungen dargestellten Ausfuhrungsbeispielen eingehend erlautert. Es zeigt dabei 

Fig.l ein Blockschaltbild eines Teils eines Ubertragungssystems gemafi Stand 

der Technik; 

Fig.2 ein Blockschaltbild einer Ausfuhrungsform des erfindungsgemaBen 
Ubertragungssystems; 

Fig. 3 eine Echo-Unterdruclomgseinheit gemaB Stand der Technik; 

Fig.4 eine weitere Ausfuhrungsform des erfindungsgemaBen 

Ubertragungssystems; 

Fig. 5 eine Echo-Unterdruckungseinheit fur ein erfindungsgemaBes 

Ubertragungssystem; 

Fig.6 ein Blockschaltbild einer weiteren Ausfiihrungsform des 
erfindungsgemaBen Ubertragungssystems; 

Fig. 7 eine teilweise Darstellung einer weiteren Variante des 
erfindungsgemaBen Ubertragungssystems und 



Fig. 8 ein Detail des Blockschaltbildes gemaB Fig. 6. 

In Fig.l ist ein Teil eines Ubertragungssystems zur Ubertragung von 
Sprachinformation ftir mehrere Teilnehmer eines Dateniibertragungsnetzes 1 gezeigt, wobei 
im besonderen eine Sprachdatenverbindung zwischen zwei Teilnehmern 50, 51 dargestellt ist. 
Jeder Teilnehmer ist jeweils mit einer Sprech- und einer Horvorrichtung 6, & und 7, T 
ausgeriistet ist, tiber die ein Sprachsignal erzeugt bzw. horbar gemacht werden kann. Fur das 
Dateniibertragungsnetz 1, uber welches die Sprachdatenubertragung erfolgt, ist in Fig.l das 
Internet mit dem ftir alle Teilnehmer gemeinsamen IP-(Internet Protocol)-Protokoll 
angegeben. Es kann die Sprachdatenubertragung im Rahmen der Erfmdung iiber jedes 
beliebige, ahnliche Dateniibertragungsnetz, z.B. LAN, Intranet, o.a., erfolgen. Die zu 
ubertragenden Daten werden in Datenpakete unterteilt und wahrend der Ubertragung 
zwischen den Teilnehmern ausgetauscht, wobei innerhalb des jeweiligen Netzes der 
Transport der Datenpakete je nach verfugbaren Ubertragungsleitungen verwaltet wird. Es 
konnen auch mehrere, miteinander gekoppelte Netze ftir eine solche Sprachubertragung 
eingesetzt werden, wobei bei unterschiedlichen Protokollen in diesen Netzen zur 
Umwandlung geeignete Einheiten vorgesehen sein miissen. 

In vielen Fallen findet die Ubertragung der Datenpakete auf der Grundlage des 
Internet-Protokolls (IP) statt, wobei jeder Teilnehmer uber eine in einer 
Sprachdatenubertragungseinheit 3 beinhalteten Empfangs- und Sendeeinheit mit dem IP- 
Netzwerk 1 in Verbindung steht. 

Die Sprachdatenubertragungseinheit 3 umfaBt weiters eine Sprach- 
Datenwandlereinheit zur Umwandlung der Datenpakete in ein Sprachsignal und umgekehrt. 
Weiters konnen verschiedene Signalkodierungen, z.B. PCM-Kodierung, Anwendung finden, 
die beim Empfang und beim Senden entsprechend beriicksichtigt werden miissen. 

Die vom Teilnehmer 50 uber die Empfangseinheit empfangene 
Sprachinformation wird in der Sprachdatenubertragungseinheit 3 in ein Sprachsignal 
gewandelt und iiber den Ausgang 41 zur Horvorrichtung 7 weitergeleitet und dort 
wiedergegeben. Das vom Teilnehmer 50 iiber die Sprechvorrichtung 6 erzeugte Sprachsignal 
gelangt iiber einen Eingang 42 in die Sendeeinheit, wird dort in Sprachinformation gewandelt 
und gesendet, welche Sendeeinheit in der Sprachdatenubertragungseinheit 3 beinhaltet ist. 
Nach Aufbau einer Verbindung zwischen dem Teilnehmer 50 und dem Teilnehmer 51 iiber 
das Dateniibertragungsnetz 1 kann der Teilnehmer 5 1 mit seiner Horvorrichtung T das in der 
Sprechvorrichtung 6 erzeugte Sprachsignal nach Wandlung in Datenpakete, Ubertragung und 
Riickwandlung der Datenpakete horbar machen. Der Teilnehmer 51 kann seinerseits iiber die 
Sprechvorrichtung & ein Sprachsignal erzeugen, das ftir den Teilnehmer 50 nach 
entsprechender Ubertragung horbar ist. Wahrend des Gesprachs entsteht eine Riickwirkung 
des vom Teilnehmer 50 zum Teilnehmer 51 ubertragenen Sprachsignals, da dieses teilweise 
durch akustische Kopplung oder direkt von der Horvorrichtung T in die Sprechvorrichtung 6 1 
gelangt und dort zu einem Sprachsignal gewandelt wird, das dem gesendeten Sprachsignal 
mit geringerer Amplitude entspricht. 

Ist der Teilnehmer 50 aktiv und spricht in die Sprechvorrichtung, z.B. ein 
Mikrophon 6, entsteht auf der Seite des Teilnehmers 51 ein Echo durch die akustische 



Kopplung der Sprechvorichtung & und der Horeinrichtung 7\ z.B. einem Lautsprecher, 
welches durch die Echo-Unterdriickungseinheit 5' geloscht wird, indem von dem in der 
Sprechvorrichtung 6' erzeugten Sprachsignal, das am Additions-Eingang IT der Echo- 
Unterdriickungseinheit 5' anliegt, das von der Empfangseinheit der Einheit 3' an den 
Subtraktionseingang IT kommende, verzogerte Sprachsignal subtrahiert wird. In derselben 
Weise wird das durch die Horvorrichtung 7 hervorgerufene akustische Signal teilweise in die 
Sprechvorrichtung 6 gelangen und wiirde xiber diese als Echo an den Teilnehmer 51 
zuriickgesendet werden. In der Echo-Unterdriickungseinheit 5 wird nun von dem in der 
Sprechvorrichtung 6 erzeugten Signal das uber die Horvorrichtung 7 abgegebene 
Sprachsignal abgezogen und damit vom Echo befreit. 

Fur den Fall, daB die Echo-Unterdriickungseinheit auf der Seite des 
Teilnehmers 51 versagt oder daB sie aus Kostengriinden nicht implementiert sein sollte, wird 
das Ubertragungssystem gemaB Fig.2 auf der Seite des Teilnehmers 50 erweitert. 

ErfindungsgemaB wird dies dadurch erreicht, daB eine weitere Echo- 
Unterdriickungseinheit 9 mit einem Additions- und einem Subtraktions-Eingang 14, 15 
vorgesehen ist, deren Ausgang 16 mit der Horvorrichtung 7 verbunden ist. Der Subtraktions- 
Eingang 15 ist dabei mit dem Sendeeingang 42 der Sprachdateniibertragungseinheit 3 und der 
Additions-Eingang 14 mit dem Empfangseingang 41 der Sprachdateniibertragungseinheit 3 
verbunden. 

Dabei wird von dem beim Teilnehmer 51 entstehenden und uber das 
Datemibertragungsnetz 1 ubertragenen Empfangssignal auf der Seite des mit diesem 
verbundenen Teilnehmers 50 das mittels einer Verzogerungskette mindestens um die 
Netzverzogerungszeit verzogerte, das Echo verursachende und mit Koeffizienten k 
gewichtete Sprachsignal subtrahiert. Die Darstellung des erfindungsgemaBen 
Ubertragungssystems ist in Fig.2 in vereinfachter Form vorgenommen worden, wobei 
analoge Sprachsignale in den Echo-Unterdruckungseinheiten 5, 9 subtrahiert werden, um die 
Echosignale auszuloschen. In modernen Systemen geschieht diese Echo-Unterdriickung 
allerdings hauptsachlich in digitaler Form, wie es in Fig.6 gezeigt ist. In allgemeiner 
Darstellung ist dabei jeweils in den Pfad zu den Sprachvorrichtungen 6 bzw. 6' und zu den 
Horvorrichtungen 7 bzw. T jeweils ein Analog/Digital- Wandler 61 bzw. 6V und ein 
Digital/ Analog- Wandler 60 bzw. 60' zwischengeschaltet, liber die das zu sendende analoge 
Sprachsignal in digitale Sprachinformation und die empfangene bzw. von der Echo- 
Unterdriickungseinheit 9 kommende digitale Sprachinformation in ein analoges Sprachsignal 
umgewandelt wird. Damit ist klargestellt, daB die Echo-Unterdriickung selbst in der 
jeweiligen Echo-Unterdriickungseinheit 5, 9 in digitaler Form geschieht. In Fig. 8 ist ein 
Detail des Blockschaltbildes gemaB Fig. 6 zur Veranschaulichung nochmals hervorgehoben. 
Die Echo-Unterdriickungseinheit ist in Form eines DSP oder eines schnellen Rechners 
realisiert. Die Echo-Unterdriickungseinheit 9 kann in einer praktischen Realisierung in einem 
einzigen Rechner oder DSP mit der Echo-Unterdriickungseinheit 9 zusammengefaBt sein. 

Wahrend die Echo-Unterdriickungseinheit 5 weiterhin durch ein 
konventionelles System zur Unterdriickung von Echos mit einer Laufzeit von maximal 64 ms 
ist, muB die weitere Echo-Unterdruckungseinheit 9 in der Lage sein, Echolaufzeiten im 



Bereich z.B. von 500ms bis 1500 ms zu unterdriicken, da zwischen dem Subtraktionseingang 
15 und dem Additionseingang 14 die voile Verzogerungszeit des Datennetzwerkes 1 wirksam 
wird. Aus diesem Grund eignen sich die bekannten Echo-Unterdruckungseinheiten nur sehr 
bedingt fur die Verwendung bei paketorientierter Ubertragung. Dazu sei die Wirkungsweise 
einer bekannten Echo-Unterdriickungseinheit anhand der Darstellung in Fig. 3 naher erlautert, 
wobei in den Diagrammen a, b, c, d der Zeitverlauf des jeweiligen Signals an den mit den 
von den Diagrammen wegweisenden Pfeilen gekennzeichneten Stellen dargestellt ist. 
Vorausgesetzt wird dabei wieder, daB die Echo-Unterdriickung sowohl in analoger als auch in 
digitaler Form geschehen kann. Die gezeigten Signale liegen bei digitaler Ausfuhrung der 
Echo-Unterdruckungseinheit als digitalisierte Abtastwerte bzw. Sprachinformation vor. 

Das von der Empfangseinheit der Sprachdatemibertragungseinheit 3 
kommende Sprachsignal ist beispielhaft im Diagramm a der Fig. 3 abgebildet, welches am 
Ort des Teilnehmers 50 ein oder mehrere Echos, je nach Art und Lange des vom Schall 
durchlaufenen Weges zwischen der Horvorrichtung 7 und der Sprechvorrichtung 6, erzeugt. 
In Diagramm b ist das Echosignal als gegeniiber dem Diagramm a abgeschwachtes Signal 
dargestellt, das entsprechend zeitverzogert ist. Dieses Signal b gelangt in den 
Additionseingang 12 der Echo-Unterdriickungseinheit 9. Signal a wird am 
Subtraktionseingang 1 1 der Echo-Unterdriickungseinheit 9 eingespeist, sodaB dieses invertiert 
und in einer Verzogerungskette mit Verzogerungsgliedern 21, 22, 23 verzogert wird. 
Zwischen diesen befinden sich Anzapfungsstellen 31, 32, an denen das verzogerte Signal 
abgegriffen, mit einem Koeffizienten k abgeschwacht und an den mit "+" gekennzeichneten 
Summierpunkt gefiihrt werden kann. Uber diese verschiedenen Anzapfungsstellen konnen 
daher auch mehrfache Echos zugleich kompensiert werden, da fur jede mogliche Zeitlage des 
Echosignals eine entsprechende Anzapfungsstelle vorgesehen werden kann. 

Durch Subtraktion des verzogerten imd abgeschwachten Signals a von dem in 
der Sprechvorrichtung 6 erzeugten Echosignals entsteht das im wesentlichen echofreie Signal 
d. Fur die Berechnung der Koeffizienten sind mehrere bekannte Verfahren geeignet, z.B. 
kann ein (N)LMS (Normalized) Least Mean Square-Fit vorgenommen werden, uber den die 
Koeffizienten fur ein Minimum des kompensierten Signals berechnet werden kann. 

Eine solche Echo-Unterdriickungseinheit, wie sie gemaB Fig.3 Stand der 
Technik ist, eignet sich fur herkommliche Telephonieanwendungen sehr gut, erftillt aber ihre 
Aufgaben nur bedingt, wenn die Sprachiibertragung uber ein paketorientiertes Datennetzwerk 
erfolgen soli. Durch die hohe Verzogerungszeit innerhalb des Datennetzwerkes 1 wachst der 
Aufwand ftir die Echounterdriickung als auch die Einstellzeit der Koeffizienten k 
proportional zur maximalen Echolaufzeit. 

GemaB einer Ausfiihrungsform der Erfindung kann diesem Problem dadurch 
abgeholfen werden, daB das erste Verzogerungsglied 20 der Verzogerungskette eine relativ 
hohe Speicher- Verzogerungszeit aufweist, wie dies in Fig.5 dargestellt ist. 

Anstatt eine iibliche Verzogenmgskette anzuwenden, die Anzapfungen vom 
Zeitpunkt 0 bis zur maximalen Echolaufzeit aufweist, beginnt die Verzogerungskette mit 
einem Verzogerungsglied 20 mit relativ langer Speicher- Verzogerungszeit, die im 
wesentlichen der minimalen Gesamtlaufzeit der Sprachdatensignale in beiden Richtungen des 



Datennetzwerkes entspricht. Die Echo-Unterdruckungseinheit 9 wirkt dann z.B. nicht - wie 
bisher bekannt - fur Echos im Bereich von 0 bis 800 ms sondern nur fur Echos im Bereich 
von 600 ms bis 800 ms. Aufgrund der Gesamtlaufzeit durch das Datennetzwerk 1 konnen in 
diesem Anfangszeitraum keine Echos entstehen. Der Vorteil dieser Grundverzogerung liegt 
darin, daB die Echounterdriickungeinheit viel weniger Rechenleistung z.B eines 
Signalprozessors und auch Speicher benotigt, da sowohl weniger Koeffizienten k berechnet 
als auch weniger Multiplikationen bzw. Additionen ftir die Berechnung des inversen 
verzogerten Signals durchgefuhrt werden miissen. 

Eine weitere Verbesserung der Echounterdriickung kann erzielt werden, wenn 
gemaB einem in Fig.4 gezeigten Ausfuhrungsbeispiel der Erfindung die weitere Echo- 
Unterdriickungseinheit 9 einen Steuereingang 17 zur Steuerung einer der 
Mindestverzogerungszeit des Netzwerks, das ist die vorgenannte Gesamtlaufzeit in beiden 
Richtungen, entsprechenden Speicher- Verzogerungszeit des Sprachsignals bzw. der 
Sprachinformation aufweist, wobei der Steuereingang 17 mit dem Ausgang einer mit der 
Sprachdatenubertragungseinheit 3 verbundenen Steuereinheit 18 verbunden ist. In gleicher 
Weise wie im Ausfuhrungsbeispiel gemaB Fig.6 konnen wieder entsprechende 
Analog/Digital- Wandler bzw. Digital-Analog- Wandler und digitale Echo- 
Unterdriickungseinheiten 5, 9 vorgesehen sein. 

Dadurch konnen iiber die Steuereinheit 1 8 verschiedene Zustande an die Echo- 
Unterdriickungseinheit 9 signalisiert werden. So kann zum Beispiel ein verlorengegangenes 
Sprachdatenpaket innerhalb der eintreffenden Datenpakete detektiert und die Echo- 
Unterdriickungseinheit 9 entsprechend gesteuert werden, sodaB kein falsches inverses Signal 
c (Fig. 3) erzeugt wird, das dann auf kein passendes Signal b (Fig.3) treffen wiirde. 

Weiters ist es tiblich, eine Ubermittlungsunterbrechung wahrend Sprachpausen 
vorzunehmen. Um zu verhindern, daB die fehlenden Datenpakete eine Verschiebung der 
Echo-Ausloschungszeitpunkte bewirken, kann beispielsweise vorgesehen sein, kann 
beispielweise eine Neuberechnung der Koeffizienten verhindert werden. 

Es kann auch versucht werden, bei Wiederholung des vorangegangenen 
Sprachdatenpakets das zugehorige inverse Signal zu erzeugen. Dies ist aber nur dann 
moglich, wenn die hiezu notwendigen Sprachdaten noch in der Verzogerungskette enthalten 
sind. Diese miiBte zu diesem Zweck entsprechend langer ausgefiihrt werden. 

In Datennetzwerken, in denen sich die Gesamtlaufzeit verandern kann, konnen 
altemativ zwei Verbesserungen vorgenommen werden. 

Ist die Veranderung der Laufzeit bekannt aber nicht quantitativ feststellbar, 
werden einfach die Koeffizienten k der Echo-Unterdriickungseinheit auf Null gesetzt, um zu 
verhindern, daB ein doppeltes Echo horbar wird. Sollte aber durch eine geeignete Vorrichtung 
die Netz-Verzogerungszeit-Anderung, z.B. durch Auswertung der Zeitinformation des 
Echtzeit-Protokolls, bekannt sein, kann ein permanentes Nachfuhren der Verzogerungszeit 
des ersten Verzogerungsgliedes 20 (Fig. 5) mit relativ langer Speicherverzogerungszeit 
erfolgen, sodaB eine sehr effiziente Ausloschung mit geringer Rechner- und Speicherkapazitat 
ausftihrbar ist. 



Es wird dabei die Anderung der Netz-Verzogerungszeit gemessen und die 
Werte der den Verzogerungsgliedern 20, 22, 23 zugeordneten Koeffizienten k innerhalb der 
Verzogerungskette entsprechend dieser Anderung, zeitlich gesehen nach vor oder zuriick, 
verschoben. Die Speicher- Verzogerungszeit des ersten Verzogerungsgliedes 20 mit der 
relativ hohen Verzogerungszeit kann iiber die Sprachdateniibertragungseinheit 3 gesteuert 
werden und die Verschiebung der Koeffizienten k innerhalb der Verzogerungskette 
automatisch mit der Veranderung der Verzogerungszeit des ersten Verzogerungsgliedes 20 
vorgenommen werden. 

Im Ausftihrungsbeispiel gemaB Fig. 7 ist eine Variante der Erfindung 
abgebildet, in der die Sprech- und die Horvorrichtung durch ein Teilnehmerendgerat 70 
verwirklicht sind, welches iiber eine Teilnehmerleitung 71 an eine Teilnehmerschnittstelle 72 
angeschlossen ist, die in analoger oder digitaler Form vorgesehen sein kann. In einer Echo- 
Unterdriickungseinheit 73 sind die Echo-Unterdruckungseinheiten 5, 9 aus Fig. 6 
zusarnmengefaBt. Die weitere Anbindung an das Dateniibertragungsnetzwerk geschieht in 
gleicher Form wie in Fig. 6. Dadurch kann die erfindungsgemaBe Echo-Unterdruckung auch 
bei Einbeziehung einer Teilnehmerschnittstelle angewandt werden. 
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PATENTANSPRUCHE 



1. Ubertragungssystem zur Ubertragung von Sprachinformation innerhalb zumindest 
eines mehrere Teilnehmer verbindenden Datentibertragungs-Netzes, z.B. LAN, Intranet, 
Internet, in welchem die Ubertragung mittels Datenpaketen auf der Grundlage zumindest 
eines gemeinsamen Protokolls, z.B. Internet-Pro tokolls, erfolgt, und jeder Teilnehmer liber 
eine eine Sende- und Empfangseinheit sowie eine Sprach-Datenwandlereinheit beinhaltende 
Sprachdatenubertragungseinheit, gegebenenfalls einen Analog/Digital-Wandler bzw. einen 
Digital/ Analog- Wandler und eine daran angeschlossene Sprech- und Horvorrichtung mit dem 
Netz in Verbindung steht, wobei die Sprechvorrichtung bzw. der zwischengeschaltete 
Analog/Digital-Wandler iiber einen Additions-Eingang einer Echo-Unterdruckungseinheit 
und deren Ausgang mit der Sendeeinheit verbunden ist und ein Subtraktions-Eingang der 
Echo-Unterdriickungseinheit mit der Horvorrichtung bzw. dem zwischengeschalteten 
Digital/Analog- Wandler verbunden ist, dadurch gekennzeichnet, daB eine weitere Echo- 
Unterdriickungseinheit (9) mit einem Additions- und einem Subtraktions-Eingang (14, 15) 
vorgesehen ist, deren Ausgang (16) mit der Horvorrichtung (7) bzw. mit dem 
zwischengeschalteten Digital/Analog- Wandler verbunden ist, und daB der Subtraktions- 
Eingang (15) mit der Sendeeinheit der Sprachdatenubertragungseinheit (3) und der 
Additions-Eingang (14) mit der Empfangseinheit der Sprachdatenubertragungseinheit (3) 
verbunden ist. 

2. Ubertragungssystem nach Anspruch 1, dadurch gekennzeichnet, daB die weitere 
Echo-Unterdriickungseinheit (9) einen Steuereingang (17) zur Steuerung einer der 
Mindestverzogerungszeit des Netzwerks entsprechenden Speicher-Verzogerungszeit des 
Sprachsignals bzw. der Sprachinformation aufweist, wobei der Steuereingang (17) mit dem 
Ausgang einer mit der Sprachdatenubertragungseinheit (3) verbundenen Steuereinheit (18) 
verbunden ist. 

3. Ubertragungssystem mit einer Echo-Unterdriickungseinheit, welche eine aus mehreren 
Verzogerungsgliedern gebildete Verzogerungskette umfaBt, dadurch gekennzeichnet, daB 
das erste Verzogerungsglied (20) der Verzogerungskette eine relativ hohe Speicher- 
Verzogerungszeit aufweist, die im wesentlichen der minimalen Gesamtlaufzeit der 
Sprachdatensignale in beiden Richtungen des Datennetzwerkes (1) entspricht. 



4. Ubertragungssystem nach Anspruch 3, dadurch gekennzeichnet, daB die Speicher- 
Verzogerungszeit des ersten Verzogerungsgliedes (20) der Verzogerungskette, vorzugsweise 
durch Auswertung der Zeitinformation des Echtzeit-Protokolls, uber die 
Sprachdatentibertragungseinheit (3) steuerbar ist. 

5. Verfahren zur Ubertragung von Sprachinformation innerhalb zumindest eines mehrere 
Teilnehmer verbindenden Dateniibertragungs-Netzwerkes, z.B. LAN, Intranet, Internet, in 
welchem die Ubertragung mittels Datenpaketen auf der Grundlage zumindest eines 
gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, wobei die von jedem Teilnehmer 
uber eine Empfangseinheit empfangene Sprachinformation in ein Sprachsignal gewandelt und 
iiber eine Horvorrichtung wiedergegeben und das von jedem Teilnehmer uber eine 
Sprechvorrichtung erzeugte Sprachsignal in Sprachinformation gewandelt und in einer 
Sendeeinheit gesendet wird, und wobei zur Echoausloschung die iiber die Empfangseinheit 
empfangene Sprachinformation oder die in ein Sprachsignal gewandelte Sprachinformation 
verzogert und mit Koeffizienten gewichtet und von dem in der Sprechvorrichtung erzeugten 
Sprachsignal bzw. dem in eine entsprechende Sprachinformation gewandelten Sprachsignal 
subtrahiert wird, dadurch gekennzeichnet, dafi von dem beim jeweils anderen Teilnehmer 
(50, 51) entstehenden und iiber das Dateniibertragungsnetz (1) riickubertragenen Echosignal 
auf der Seite des mit diesem verbundenen Teilnehmers (50, 51) das mittels einer 
Verzogerungskette (21, 22, 23) mindestens urn die Netzverzogerungszeit verzogerte, das bzw. 
die Echo verursachende und mit den Koeffizienten (k) gewichtete Sprachsignal bzw. 
Sprachinformation subtrahiert wird. 

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daB der bei der Ubertragung 
entstehende Verlust an Datenpaketen detektiert wird und in Abhangigkeit davon die 
Subtraktion des entsprechenden, verzogerten Sprachsignals bzw. der entsprechenden, 
verzogerten Sprachinformation unterdriickt wird. 

7. Verfahren nach einem der Anspriiche 4 oder 5, dadurch gekennzeichnet, daB bei 
Verlust eines oder mehrerer Datenpakete das jeweils vorangegangene Sprachdatenpaket 
wiederholt wird. 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dafi bei Wiederholung des 
jeweils vorangegangenen Sprachdatenpakets die Subtraktion eines entsprechenden 
Sprachsignals bzw. einer entsprechenden Sprachinformation auf der Seite des verbundenen 
Teilnehmers unterdriickt wird. 

9. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dafi bei Wiederholung des 
jeweils vorangegangenen Sprachdatenpakets das zugehorige gespeicherte Sprachsignal bzw. 
die zugehorige gespeicherte Sprachinformation des verbundenen Teilnehmers mit 
Verzogerung und Gewichtung subtrahiert wird. 



10. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daB bei Auftreten einer 
Anderung der Netz-Verzogerungszeit die Koeffizienten (k) der Verzogerungskette (20, 22, 
23) auf Null gesetzt werden. 

11. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daB die Anderung der Netz- 
Verzogerungszeit gemessen wird, und daB die Werte der den Verzogerungsgliedern (20, 22, 
23) zugeordneten Koeffizienten k innerhalb der Verzogerungskette entsprechend dieser 
Anderung verschoben werden. 

12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daB die Speicher- 
Verzogerungszeit des ersten Verzogerungsgliedes (20) mit der relativ hohen 
Verzogerungszeit, vorzugsweise durch Auswertung der Zeitinformation des Echtzeit- 
Protokolls, uber die Sprachdatenubertragungseinheit (3) gesteuert wird, und daB die 
Verschiebung der Koeffizienten k innerhalb der Verzogerungskette automatisch mit der 
Veranderung der Verzogerungszeit des ersten Verzogerungsgliedes (20) vorgenommen wird. 
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ZUSAMMENFASSUNG 



Ubertragungssystem zur Ubertragung von Sprachinformation innerhalb zumindest eines 
mehrere Teilnehmer verbindenden Dateniibertragungs-Netzes, z.B. LAN, Intranet, Internet, 
in welchem die Ubertragung mittels Datenpaketen auf der Grundlage zumindest eines 
gemeinsamen Protokolls, z.B. Internet-Protokolls, erfolgt, und jeder Teilnehmer iiber eine 
eine Sende- und Empfangseinheit sowie eine Sprach-Datenwandlereinheit beinhaltende 
Sprachdatenubertragungseinheit und eine daran angeschlossene Sprech- und Horvorrichtung 
mit dem Netz in Verbindung steht, wobei die Sprechvorrichtung iiber einen Additions- 
Eingang einer Echo-Unterdriickungseinheit und deren Ausgang mit der Sendeeinheit 
verbunden ist und ein Subtraktions-Eingang der Echo-Unterdriickungseinheit mit der 
Horvorrichtung verbunden ist, und eine weitere Echo-Unterdriickungseinheit (9) mit einem 
Additions- und einem Subtraktions-Eingang (14, 15) vorgesehen ist, deren Ausgang (16) mit 
der Horvorrichtung (7) verbunden ist, und der Subtraktions-Eingang (15) mit der 
Sendeeinheit der Sprachdatenubertragungseinheit (3) und der Additions-Eingang (14) mit der 
Empfangseinheit der Sprachdatenubertragungseinheit (3) verbunden ist. 
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The invention relates to a transmission system for transmitting speech information within at least one 
data transmission network, such as LAN, Intranet, Internet, connecting several subscribers, in which 
transmission is carried out by means of data packets on the basis of at least one shared protocol, e.g. 
Internet protocol, and each subscriber is connected to the network via a voice data transmission unit, 
possibly an analog-to-digital converter and a digital-to-analog converter, comprising a transceiver unit 
and a voice data conversion unit as well as a speaker and an earpiece unit connected to said voice 
data transmission unit, the speaker unit or the inserted analog-to-digital converter being connected to 
the transmission unit via an addition input of an echo cancellation unit and the output thereof, and a 
subtraction input of the echo cancellation unit being connected to the earpiece unit or to the inserted 
digital-to-analog converter. 

In networks such as, e.g. LAN, Intranet, Internet or the like which foot on a standardized protocol, e.g. 
the Internet protocol, each network subscriber is assigned an address from which data are sent to 
other subscribers or at which data sent by other subscribers can be received. Since speech may also 
be transmitted in the form of digital data, such data transmission networks may also be used for 
transmitting speech. Within the scope of the invention, the type of the network and of the transfer 
protocol are not limited to the above mentioned known denominations, the invention may also be 
used for any connected networks that may be interconnected through gateways at certain points. 

In heretofore known speech transmission systems of the type mentioned herein above, speech 
transmission is carried out in defined packets that are sent from the transmitter station to a receiving 
subscriber which receives them. For this purpose, the packets are composed in consecutive 
sequence of the digitized sampling values of the speech signal to be transmitted and can be coded 
accordingly for transmission on the transmitter side and decoded upon reception on the side of the 
receiver. The received sampling values are again combined into a speech signal, speech signal 
meaning all the acoustic vibrations lying in the audible range. Unlike transmission over telephone 
lines, the peculiarity of speech transmission in data transmission networks consists in that the 
transmission bandwidth is not always guaranteed by the provider. Depending upon the presence of 
free lines, constant alterations of the path provided over which the data packets are transmitted 
likewise occur at different nodes. On account of the differing transit times or the differing data paths, 
data packets that have been sent later may arrive earlier at the receiver's than data packets sent 
earlier. Due to such delays, it may happen that discrete data packets do not arrive at the right time at 
the receiver's, thus not being available in time. Furthermore, the data packets may get lost on account 
of transmission errors. 



In greater networks such as e.g. Internet, the variations in transmission time delays are clearly 
noticeable and 
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depend on the respective load placed on said network at this very moment by the different 
subscribers. Besides changes due to the time of the day, certain occurrences may bring about 
retardations that are in no way foreseeable. 

A system for switching and transmitting speech signals over a packet switching net, more specifically 
over the Internet, and a conventional telephone network is described in WO-A-97/14238 for example. 
This system permits a telephone connection from a telephone terminal to a computer connected to 
the internet. 

In addition to the delay occurring in the transmission network, echo signals also disturb speech 
transmission. The acoustic coupling between a talking device, e.g. a microphone, and a hearing 
device, e.g. a loudspeaker, a phone receiver or the like in a handsfree equipment, in an earpiece or 
the like, or the electric coupling caused by a hybrid circuit of an analog two-wire phone line can cause 
such echo signals to form. 

Echo signals occur more specifically when the acoustic signals generated by a speaker return, more 
or less delayed, to his ear. When the time delay of the sound is relatively short, e.g. less than 1 ms, 
the arising echo does not cause any disturbances since the natural acoustic coupling between mouth 
and ear or sound reflections in the surroundings via mouth, wall and ears also occasion delays of the 
same dimension to happen, the human ear being permanently exposed to such delays so that they 
are no longer consciously perceived by men. 

With longer echo delay times that are generated by delays in the transmission path as they occur in 
speech transmission in packet oriented data networks and which may amount to up to several 100 
ms, the echo, depending on its loudness, disturbs or makes communication almost impossible. 

Echos can be suppressed by appropriate subtraction of the delayed receiver signal from the signal to 
be transmitted. This may be performed either in the analog form by means of summing circuits or in 
the digital form by preferably using a Digital Signal Processor (DSP). The invention is suited to both 
analog and digital echo cancellation. 

Since expenditure and complexity of an echo cancellation unit is proportional to the maximum echo 
delay time, the attempt is being made to locally suppress the echos on either side of the network, that 
is on both the receiver and the transmitter side when transmitting speech over the data network, thus 
to prevent echos from being transmitted over the data network. 

In case however, the echo cancellation system should fail to work on the side of one subscriber, or 
should it not have been implemented owing to the cost it would have involved, the echo created there 
will be transmitted unhindered to the subscriber connected with the first one and will disturb there the 
course of the conversation. 
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The conventional echo cancellation units that can overcome such echos are mainly designed for 
transmissions over the telephone network telephony system and therefore for fixed, relatively short 
delay times. For speech transmission over a packet oriented data network with delay times ranging 
from 500 ms to 1500 ms though, these known units are only efficient to a limited extent. 

Due to the specific properties of a packet oriented speech transmission, a conventional echo 
cancellation unit may even cause the echo behavior to worsen. If, on account of the permanently 
changing network properties for example, the echo signal is shifted relative to its original time 
position, both the echo and the delayed and inverted signal produced for echo cancellation are 
suddenly to be found in the receiver channel and are no longer canceling out. This condition is kept 
up until the echo cancellation unit has adjusted anew. 

If on the contrary, individual data packets get lost during transmission, the inverse signal suddenly 
becomes audible because it does not meet with the lost signal to be erased. 

it is therefore the object of the invention to indicate a transmission system of the type mentioned 
herein above that makes it possible, in a technically easy and reliable manner, to erase echos for high 
delay times, more specifically in packet oriented data transmissions. 

This is achieved according to the invention by providing an additional echo cancellation unit with an 
addition and a subtraction input, the output thereof being connected to the earpiece unit or to the 
inserted digital-to-analog converter and wherein the subtraction input is connected to the transmitter 
unit of the voice data transmission unit and the addition input is connected to the receiver unit of the 
voice data transmission unit 

As a result thereof, the echo generated by the subscriber located on the respective other side of the 
data transmission network is eliminated by subtracting from the returned echo signal the voice 
signal(s) or speech information originally produced in the speaker unit and delayed by at least the 
network delay time. As described herein above, subtraction may be carried out either in the analog or 
digital form. 

In another embodiment of the invention, there may be provided that the additional echo cancellation 
unit has a control input for controlling a memory delay time of the voice signal or of the speech 
information that corresponds to the minimum delay time of the network, the control input being 
connected to the output of a control unit connected to the voice data transmission unit. 

The control unit allows to determine the instant network delay time or to detect lost data packets and 
to suppress an accordingly delayed and inverted transmitter signal in order to prevent the inverted 
signal formed in replacement of the lacking data packet from reaching the earpiece unit 

According to another embodiment of the invention, there may be provided in a transmission system 
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with an echo cancellation unit comprising a delay line consisting of several delay elements that the 
first delay element of the delay line has a relatively high memory delay time that is substantially equal 
to the minimum overall delay time of the voice data signals in both directions of the data network. 
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Although echo signals may even occur in a delay scope of max. 64 ms, the overall delay time for the 
data network is ten- to twenty-fold. The expenditure for the delay elements and for the calculation of 
the coefficients related thereto increases proportionally to the maximum echo delay time. Instead of 
providing for a conventional delay line with an evenly distributed number of delay elements with 
tappings for weighting the delayed signal with coefficients k arranged therein between, the first delay 
element fitted with a relatively high memory delay time makes a delay time possible that corresponds 
to the minimum overall delay time of the voice signals in both directions. Transmission cannot be 
carried out with less delay time, so that the number of delay elements with tappings corresponding to 
said delay time can be combined into this first delay element. The echo cancellation unit then 
operates with a basic delay of, e.g. 600 ms and with a variable delay range of, e.g. 600 ms to 800 ms. 
On account of the overall delay time within the data transmission network, no echo signals can form 
within the range of the basic delay so that the corresponding tappings and coefficients k may be 
saved. The advantage now lies in the fact that, as a result thereof, the echo cancellation unit spends 
much less computing power and memory since both less coefficients k need to be computed and less 
multiplications must be carried out for computing the inverse delayed signal. 

According to another embodiment of the invention, the memory delay time of the first delay element of 
the delay line can be controlled through the voice data transmission unit, preferably by interpreting the 
time information of the real-time protocol. This makes it possible to permanently adjust the basic delay 
time of the transmission network, so that the number of the required delay elements may be kept 
accordingly low. 

Furthermore, the invention relates to a method of transmitting speech information within at least one 
data transmission network, such as LAN, Intranet, Internet, connecting several subscribers, in which 
transmission is carried out by means of data packets on the basis of at least one shared protocol, e.g. 
Internet protocol, the speech information received by each subscriber through a receiver unit being 
converted into a voice signal and reproduced through an earpiece unit and the voice signal generated 
by each subscriber by way of a speaker unit being converted into speech information and transmitted 
in a transmitter unit, the speech information received through the receiver unit or the speech 
information converted into a voice signal being delayed and weighted with coefficients and subtracted 
from the voice signal generated in the speaker unit or from the voice signal converted into a 
corresponding speech information for echo cancellation. 

It is the object of the invention to indicate such a method by which echo cancellation can be realized 
even with long and changing delay times within the data transmission network. 

This is achieved in accordance with the invention in that the voice signal or speech information 
producing the echo(s) that has been delayed by at least the network delay time by means of a delay 
line and weighted with the coefficients is subtracted from the echo signal created at the respective 
other subscriber and transmitted over the data transmission network on the side of the subscriber 
connected to the first one. 
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As a result thereof, the echos which return to the subscriber that had them produced through 
transmission in packet oriented networks may also be erased. In taking into consideration the network 
delay time when delaying the originally produced voice signal(s) or speech information, the therefore 
required expenditure can be substantially reduced. Subtraction may be carried out either in the digital 
or in the analog form. 

In another embodiment of the invention there may be provided that the loss of data packets arising 
from transmission is detected and the subtraction of the corresponding, delayed voice signal or of the 
corresponding, delayed speech information is suppressed accordingly. 

In this way, an inverse signal is prevented from forming that would not cause an echo to be erased 
when a lost data fails to appear but that would give rise to an echo signal itself. 

There may further be provided that, when one or several data packets have got lost, the respective 
preceding voice data packet is repeated. 

The receiver unit repeats the last data packet in order to bridge the pause occurring when a data 
packet gets lost. Here, the echo cancellation unit would generate a wrong signal since it is fed with 
the data sent on its side. The receiver unit however hereby doubles the old data packet which do not 
match the originally sent data. As a result thereof, either the echo cancellation is blocked or the last 
data packet is fed once more at the subtraction input of the echo cancellation unit. 

Accordingly, there may be provided that, on repeating the respective preceding voice data packet, the 
subtraction of a corresponding voice signal or of a corresponding speech information on the side of 
the connected subscriber is suppressed. Any echo erasure is thus prevented and inverse voice 
signals or inverse speech information within the echo cancellation unit cannot be produced wrongly. 

According to another variant of the invention there may be provided that, on repeating the respective 
preceding voice data packet, the mating, stored voice signal or the mating, stored speech information 
respectively of the connected subscriber is subtracted with delay and weighting. As a result, the 
respective right inverse voice signal or the respective right inverse speech information can be 
subtracted for the repeated voice data packets. 

There may be further provided that the coefficients k of the delay line are set to zero when the 
network delay time changes. 

In case no statement can be made with regard to the height of the change, this measure makes sure 
that no wrong echos are generated and reproduced. 

According to another variant there may be provided that the change in network delay time is 
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measured and that the values of the coefficients k assigned to the delay elements (20, 22, 23) are 
shifted within the delay line according to this change. 

The controllability of the memory delay time can thus be realized in an easy way. 

This shifting may preferably be performed automatically in that, in another embodiment of the 
invention, the memory delay time of the first delay element with the relatively high delay time is 
controlled through the voice data transmission unit by preferably interpreting the time information of 
the real-time protocol and wherein shifting of the coefficients k within the delay line is automatically 
carried out with the change of the delay time of the first delay element Due to the relatively long delay 
time of the first delay element and to its controllability, echo cancellation can be accomplished with 
always the same computing power irrespective of the network delay time. 

The invention is explained in detail herein after with the help of the exemplary embodiments illustrated 
in the enclosed drawing. 

Fig. 1 is a block diagram of a portion of a transmission system according to the state of the art; 
Fig. 2 is a block diagram of an embodiment of the transmission system according to the invention; 
Fig. 3 shows an echo cancellation unit of the prior art; 

Fig, 4 shows another embodiment of the transmission system of the invention; 

Fig. 5 shows an echo cancellation unit for a transmission system according to the invention; 

Fig. 6 is a block diagram of another embodiment of the transmission system according to the 
invention; 

Fig. 7 is a partial view of another variant of the transmission system according to the invention and 
Fig. 8 shows a detail of the block diagram according to Fig. 6. 

Fig. 1 shows a portion of a transmission system for transmitting speech information for several 
subscribers of a data transmission network 1, a voice data connection between two subscribers 50, 
51 being more specifically depicted. Each subscriber is equipped with one speaker and one earpiece 
unit 6 ( 6' and 7, T by way of which a voice signal can be created or made audible. The data 
transmission network 1, over which the voice data are transmitted, and which is indicated in Fig. 1, is 
the internet with the IP-(lnternet Protocol)-protocol shared by all the subscribers. Within the scope of 
the invention, the voice data transmission may be performed over any discretional, similar data 
transmission network, e.g. LAN, Intranet, or the like. The data to be transmitted are divided into data 
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packets and are interchanged between the subscribers during transmission, the routing of the data 
packets within the respective network being conducted according to the available transmission lines. 
Several interconnected networks may also be used for such a speech transmission, appropriate units 
must however be provided for conversion, when the protocols differ in these networks. 

In many cases, transmission of the data packets takes place on the basis of the Internet Protocol (IP), 
each subscriber being connected to the IP-network 1 over a receiver and a transmitter unit contained 
in a voice data transmission unit 3. 

The voice data transmission unit 3 further comprises a voice data conversion unit for converting the 
data packets into a voice signal and vice versa. 

Furthermore different signal encoding techniques, e.g. PCM encoding, may be used that are to be 
taken into consideration on reception and transmission. 

The speech information received through the receiving unit by subscriber 50 is converted into a voice 
signal in the voice data transmission unit 3 and is redirected via the output 41 toward the earpiece unit 
7 where it is reproduced. The voice signal produced by subscriber 50 through the speaker unit 6 
reaches via an input 42 the transmitter unit where it is converted into speech information and 
transmitted, said transmitter unit being contained in the voice data transmission unit 3. Once a 
communication between subscriber 50 and subscriber 51 has been established over the data 
transmission network 1, subscriber 51 can make audible the voice signal produced in the speaker unit 

6 by means of his earpiece unit 7'after said voice signal has been converted into data packets and 
said packets transmitted and changed back. On his side, subscriber 51 can generate through the 
speaker unit 6' a voice signal that is audible to subscriber 50 after adequate transmission. During the 
conversation, the voice signal transmitted from subscriber 50 to subscriber 51 produces a reflection 
since said voice signal reaches the speaker unit 6' in parts through acoustic coupling or directly from 
the earpiece unit 7', where it is converted into a voice signal that corresponds to the transmitted voice 
signal with a lower amplitude. 

If subscriber 50 is active and talks into the speaker unit, e.g. into a microphone 6, the acoustic 
coupling of the speaker unit 6 and of the earpiece unit 7\ e.g. a loudspeaker, causes an echo to arise, 
said echo being erased by the echo cancellation unit 5' in that the delayed voice signal proceeding 
from the receiver unit of unit 3' to the subtraction input 11' is subtracted from the voice signal 
generated in the speaker unit 6'. In the same way, the acoustic signal occasioned by the earpiece unit 

7 will partially reach the speaker unit 6 and would be sent back as an echo to subscriber 51 over said 
speaker unit. The voice signal emitted through the earpiece unit 7 is now subtracted from the signal 
generated in the speaker unit 6 in the echo cancellation unit 5 and is thus freed from the echo. 

In case of a breakdown of the echo cancellation unit on the side of subscriber 51 or in case it has not 
been implemented owing to the cost it would involve, the transmission system according to Fig. 2 is 
extended on the side of subscriber 50. 
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This is achieved according to the invention by providing an additional echo cancellation unit 9 with an 
addition and a subtraction input 14, 15 t the output 16 thereof being connected to the earpiece unit 7. 
The subtraction input 15 is thereby connected to the transmitter input 42 of the voice data 
transmission unit 3 and the addition input 14 is connected to the receiver input 41 of the voice data 
transmission unit 3. 

The voice signal producing the echo that has been delayed by at least the network delay time by 
means of a delay line and weighted with the coefficients k is subtracted from the receiver signal 
created at the other subscriber 51 and transmitted over the data transmission network (1) on the side 
of the subscriber 50 connected to the first one. The transmission system according to the invention 
has been represented in Fig. 2 in a simplified form, analog voice signals being subtracted in the echo 
cancellation units 5, 9 in order to erase the echo signals. In modem systems, this echo cancellation is 
mainly carried out in the digital form, as shown in Fig. 6. In a general representation, an analog-to- 
digital converter 61 and 61' respectively and a digital-to-analog converter 60 and 60' respectively is 
inserted each in the path leading to the speaker units 6 and 6' and to the earpiece units 7 and T 
respectively through which the analog voice signal to be transmitted is converted into digital speech 
information and the digital speech information that has either been received or that proceeds from the 
echo cancellation unit 9 is converted into an analog voice signal. It has thus clearly been defined that 
the echo cancellation itself occurs in digital form in the respective echo cancellation unit 5, 9. Fig. 8. 
displays a detail of the block diagram according to Fig. 6 for purposes of clarity. The echo cancellation 
unit 9 is realized in the form of a DSP or of a fast computer. In a practical realization, the echo 
cancellation unit 9 can be combined with the echo cancellation unit 9 in one single computer or DSP. 

While the echo cancellation unit 5 is still ... by a conventional system for suppressing echos with a 
delay time of 64 ms maximum, the other echo cancellation unit 9 must be capable of suppressing 
echo delay times ranging for example from 500 ms to 1500 ms since the full delay time of the data 
network 1 becomes effective between the subtraction input 15 and the addition input 14. For this 
reason, the known echo cancellation units are suited to be used in packet oriented transmission under 
very restricted conditions only. The way of operation of a known echo cancellation unit is therefore 
explained with the help of the representation in Fig. 3, the diagrams a, b, c, d illustrating the time 
taken by the respective signal at the places marked with the arrows pointing away from the diagrams. 
Again it is assumed that the echo cancellation can be performed in both the analog and the digital 
form. When the echo cancellation unit is of a digital design, the signals shown are digitized samplings 
or speech information. 

The voice signal proceeding from the receiver unit of the voice data transmission unit 3 is depicted by 
way of example in the diagram a of Fig. 3 and generates at the subscriber's 50 place one or several 
echos depending upon the type and length of the path on which the sound travels between the 
earpiece unit 7 and the speaker unit 6. As compared to diagram a, in diagram b t the echo signal is 
represented as an attenuated signal that is time-delayed accordingly. This signal b reaches the 
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addition input 12 of the echo cancellation unit 9. Signal a is fed at the subtraction input 11 of the echo 
cancellation unit 9 so that it is inverted and delayed in a delay line with delay elements 21, 22, 23. 
Tappings 31, 32 at which the delayed signal can be tapped, attenuated with a coefficient k and 
brought to the summing point designated at "+ n are located between said delay elements. Even 
multiple echos can therefore be simultaneously compensated by way of these different tapping 
locations since an appropriate tapping location can be provided for each possible time position of the 
echo signal. 

The substantially echo-free signal d is generated by subtracting the delayed and attenuated signal a 
from the echo signal produced in the speaker unit 6. Several known methods are suited to compute 
the coefficients, a (N)LMS (Normalized) Least Mean Square-Fit can for example be performed by 
which the coefficients may be calculated for a minimum of the compensated signal. 

Such an echo cancellation unit of the prior art according to Fig. 3 is verywell suited for conventional 
telephony applications but it performs its functions in a restricted manner only when speech 
transmission is to be carried out over a packet oriented data network. Both the complexity of echo 
cancellation and the adjusting time of the coefficients k increase proportionally to the maximum echo 
delay time on account of the high delay time within the data network 1 . 

According to an embodiment of the invention, this problem can be eliminated by providing the first 
delay element 20 of the delay line with a relatively high memory delay time as this is shown in Fig. 5. 

Instead of employing a customary delay line provided with tappings from the time 0 up to the 
maximum echo delay time, the delay line starts with a delay element 20 with a relatively long memory 
delay time that substantially corresponds to the minimum overall delay time of the voice data signals 
in both directions of the data network. Then, the echo cancellation unit 9 is not effective for echos 
ranging from 0 to 800 ms like it was heretofore known for example, but only for echos ranging from 
600 ms to 800 ms. On account of the overall delay time through the data network 1, no echos can 
occur in this initial period of time. The advantage of this basic delay lies in the fact that the echo 
cancellation unit needs much less computing power of a signal processor for example and also much 
less memory since both less coefficients k must be calculated and less multiplications and additions 
respectively need to be carried out for computing the inverse delayed signal. 

Echo cancellation may be further enhanced when, according to an exemplary embodiment of the 
invention shown in Fig. 4, the additional echo cancellation unit 9 is provided with a control input 17 for 
controlling a memory delay time of the voice signal or of the speech information respectively that 
corresponds to the minimum delay time of the network, that is the afore mentioned overall delay time 
in both directions, the control input 17 being connected with the output of a control unit 18 connected 
to the voice data transmission unit 3. Like in the exemplary embodiment illustrated in Fig. 6, 
appropriate analog-to-digital converters and digital-to-analog converters respectively, and digital echo 
cancellation units 5, 9 can be again provided for. 
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As a result thereof, different conditions can be signalized to the echo cancellation unit 9 via the control 
unit 18. A voice data packet that has got lost can thus be detected among the incoming data for 
example and the echo cancellation unit 9 can be controlled accordingly so that no wrong inverted 
signal c (Fig. 3) is produced that would not meet any matching signal b (Fig. 3). 

It is also customary to interrupt transfer during pauses occurring in speech. In order to prevent the 
missing data packets from causing the echo erasure times to be shifted, a recalculation of the 
coefficient may for example be prevented. 

On repeating the preceding voice data packet, it may also be attempted to produce the 
corresponding inverse signal. This is only possible though, when the voice data required therefore are 
still contained in the delay line. For this purpose, said delay line should be realized accordingly longer. 

In data networks in which the overall delay time can change, two improvements can alternatively be 
effected. 

If the change in the delay time is known but cannot be quantified, the coefficients k of the echo 
cancellation unit are simply set to zero in order to prevent a double echo from becoming audible. But 
if the change in the network delay time is known by way of an appropriate device, e.g. by interpreting 
the time information of the real-time protocol, a permanent tracking of the delay time of the first delay 
element 20 (Fig. 5) with a relatively long memory delay time may occur so that very efficient erasure 
with little computing and storing capacity may be carried out. 

The change in the network delay time is thereby measured and the values of the coefficients k 
assigned to the delay elements 20, 22, 23 within the delay line are shifted back and forth with respect 
to time in accordance with this change. The memory delay time of the first delay element 20 with the 
relatively high delay time can be controlled by way of the voice data transmission unit 3 and the 
shifting of the coefficients k within the delay line can be performed automatically with the change of 
the delay time of the first delay element 20. 

The exemplary embodiment according to Fig. 7 shows a variant of the invention in which the speaker 
unit and the earpiece unit are realized by a subscriber terminal 70 that is connected over a 
subscriber's line 71 to a user interface 72 that may be provided in the analog or digital form. The echo 
cancellation units 5, 9 of Fig. 6 are combined into an echo cancellation unit 73. The further connection 
to the data transmission network occurs in the same way as in Fig. 6. As a result thereof, the echo 
cancellation according to the invention can also be used when a user interface is incorporated. 
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CLAIMS 



1. Transmission system for transmitting speech information within at least one data transmission 
network, such as LAN, Intranet, Internet, connecting several subscribers, in which transmission is 
carried out by means of data packets on the basis of at least one shared protocol, e.g. Internet 
protocol, and each subscriber is connected to the network via a voice data transmission unit, possibly 
an analog-to-digital converter and a digital-to-analog converter, comprising a transceiver unit and a 
voice data conversion unit as well as a speaker and an earpiece unit connected to said voice data 
transmission unit, the speaker unit or the inserted analog-to-digital converter being connected to the 
transmission unit via an addition input of an echo cancellation unit and the output thereof and a 
subtraction input of the echo cancellation unit being connected to the earpiece unit or to the inserted 
digital-to-analog converter, wherein an additional echo cancellation unit (9) with an addition and a 
subtraction input (14, 15) is provided, the output (16) thereof being connected to the earpiece unit (7) 
or to the inserted digital-to-anaiog converter (60) respectively and wherein the subtraction input (15) is 
connected to the transmitter unit of the voice data transmission unit (3) and the addition input (14) is 
connected to the receiver unit of the voice data transmission unit (3). 

2. Transmission system according to claim 1 , wherein the additional echo cancellation unit (9) is 
provided with a control input (17) for controlling a memory delay time of the voice signal or of the 
speech information that corresponds to the minimum delay time of the network, said control input (17) 
being connected to the output of a control unit (18) connected to the voice data transmission unit (3). 

3. Transmission system with an echo cancellation unit comprising a delay line consisting of several 
delay elements, wherein the first delay element (20) of the delay line has a relatively high memory 
delay time that is substantially equal to the minimum overall propagation time of the voice data signals 
in both directions of the data network (1 ). 

4. Transmission system according to claim 3, wherein the memory delay time of the first delay 
element (20) of the delay line may be controlled by way of the voice data transmission unit (3), 
preferably by interpreting the time information of the real-time protocol. 

5.. Method of transmitting speech information within at least one data transmission network, such as 
LAN, Intranet, Internet, connecting several subscribers, in which transmission is carried out by means 
of data packets on the basis of at least one shared protocol, e.g. Internet protocol, the speech 
information received by each subscriber through a receiver unit being converted into a voice signal 
and reproduced through an earpiece unit and the voice signal generated by each subscriber through 
a speaker unit being converted into speech information and transmitted in a transmitter unit, the 
speech information received through the receiver unit or the speech information converted into a 
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voice signal being delayed and weighted with coefficients and subtracted from the voice signal 
generated in the speaker unit or from the voice signal converted into a corresponding speech 
information for echo cancellation, wherein the voice signal or speech information producing the 
echo(s) that has been delayed by at least the network delay time by means of a delay line (21 , 22, 23) 
and weighted with the coefficients (k) is subtracted from the echo signal created at the respective 
other subscriber (50, 51) and returned over the data transmission network (1) on the side of the 
subscriber (50, 51) connected to the first one. 

6. Method according to claim 5, wherein the loss of data packets arising from transmission is 
detected and the subtraction of the corresponding, delayed voice signal or of the corresponding, 
delayed speech information is suppressed accordingly. 

7. Method according to one of the claims 4 or 5, wherein, when one or several data packets have got 
lost, the respective preceding voice data packet is repeated. 

8. Method according to claim 7, wherein, on repeating the respective preceding voice data packet, 
the subtraction of a corresponding voice signal or of a corresponding speech information on the side 
of the connected subscriber is suppressed. 

9. Method according to claim 7, wherein, on repeating the respective preceding voice data packet, 
the mating, stored voice signal or the mating, stored speech information respectively of the connected 
subscriber is subtracted with delay and weighting. 

10. Method according to claim 5, wherein the coefficients (k) of the delay line (20, 22, 23) are set to 
zero when the network delay time changes. 

11. Method according to claim 5, wherein the change in network delay time is measured and the 
values of the coefficients k assigned to the delay elements (20, 22, 23) are relocated within the delay 
line according to this change. 



12. Method according to claim 11, wherein the memory delay time of the first delay element (20) with 
the relatively high delay time is controlled through the voice data transmission unit (3) by preferably 
interpreting the time information of the real-time protocol and wherein relocation of the coefficients k 
within the delay line is automatically carried out with the change of the delay time of the first delay 
element (20). 
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ABSTRACT 



Transmission system for transmitting speech information within at least one data transmission 
network, such as LAN, Intranet, Internet, connecting several subscribers, in which transmission is 
carried out by means of data packets on the basis of at least one shared protocol, e.g. Internet 
protocol, and each subscriber is connected to the network via a voice data transmission unit 
comprising a transceiver unit and a voice data conversion unit as well as a speaker and an earpiece 
unit connected to said voice data transmission unit, the speaker unit being connected to the 
transmission unit via an addition input of an echo cancellation unit and the output thereof and a 
subtraction input of the echo cancellation unit being connected to the earpiece unit; an additional echo 
cancellation unit (9) with an addition and a subtraction input (14, 15) being provided, the output (16) 
thereof being connected to the earpiece unit (7) and the subtraction input (15) being connected to the 
transmitter unit of the voice data transmission unit (3) and the addition input (14) being connected to 
the receiver unit of the voice data transmission unit (3). 



(Fig. 2) 
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